如何在无法接触的条件下研究政治精英?| 前沿综述
编者按
作为日常政治中最接近权力本质的一群人,政治精英理所应当的成为了政治学者们争相研究的对象。那么,谁是政治精英呢?首先在我们脑海中跳跃而出的自然是各级政府官僚,他们因占据了独特的政治职位而具有了操纵政治权力的能力。但是,如果我们需要研究某一类群体时进行类精英抽样,那么这些抽取出来的样本是否是政治精英?亦或者,当选的政客普遍具有某些特质或者智识,而我们是否可以将具备这些特征的人称为政治精英?
基于此,我们编译了这篇文献综述。在这篇综述中,两位作者详细阐述并划分了精英的三种类型,对不同研究需求和研究背景下的政治精英进行了限制性定义。同时,他们也对如何将精英实验研究融入到更具普遍性的研究提供了建议。极具价值的是,这篇还为我们如何获取、招募政治精英参与实验提供了建议,也为无法接触精英群体的研究者提供了一些研究“精英”特征的可替代方案。
如何在无法接触的条件下研究政治精英?
(原标题为:《对政治精英的实验与调查(Experiments and Surveys on Political Elites)》,现标题为译者所拟)
左为Joshua D. Kertzer,右为Jonathan Renshon
作者:
Joshua D. Kertzer, Harvard University
Jonathan Renshon, University of Wisconsin–Madison
译者:
焦磊,山东大学
引文格式(MLA):
Kertzer, Joshua D., and Jonathan Renshon. "Experiments and surveys on political elites." Annual Review of Political Science 25 (2022): 529-550.
内容提要
过去十年间,政治科学领域的主要进展之一便是针对政治精英的实验与调查研究的兴起。然而,精英研究数量的增长速度已经超过了我们对最佳实践方法以及如何识别高质量精英实验的集体认知水平。在本文中,我们讨论了研究政治精英所面临的部分挑战——从何为精英的界定到如何在更广泛的研究设计背景下充分利用精英实验。同时,我们也针对准入、招募和代表性问题提出了建议,并为那些无法接触精英群体的研究者提供了一些可用于研究“精英特性”的设计方案。
关键词
政治精英;精英实验;精英调查
名词解释:
精英实验(Elite experiments):此类研究中,政治精英样本被随机分配至不同的处理条件
配对实验(Paired experiments):在同一精英和大众样本上实施一套共同的处理方法和结果衡量标准的实验
职业模型视角下的精英(Occupational models of elites):在这种模型中,政治精英是因其制度角色而对公共政策具有影响力的行动者
构成模型视角下的精英(Compositional models of elites):在这种模型中,政治精英被视为由共同的社会经济特征定义的独特阶层
认知模型视角下的精英(Cognitive models of elites):在这种模型中,政治精英以其特定领域的专业知识和经验为特征
互补实验(Complementary experiments):在精英和大众样本上分别实施互不重叠的处理措施和结果衡量标准的实验
污染先验信息(Poisoning the well):指当受访者因参与某位研究者的项目而产生负面体验时,降低了他们未来参与其他研究者项目的可能性
引言
过去十年间,政治科学领域的重要进展之一是针对政治精英的实验和调查研究日益增多。鉴于许多关于政治的理论无论直接还是间接都是围绕着地方、国家或国际层面上精英的信念或行为展开的,这一现象并不令人意外。在该学科的所有顶级期刊以及其各个实证子领域中,如美国政治(例如Broockman & Skovron 2018, Hertel-Fernandez et al. 2019)、比较政治(例如Grossman & Michelitch 2018, Sheffer et al. 2018, Pereira 2021)以及国际关系(IR)(例如Hafner-Burton et al. 2014, Findley et al. 2017a),精英样本的使用都有所增加。这一点在机构实践中也有所体现:精英实验已成为中西部政治科学协会年度会议、南部政治科学协会年会及众多大学举办的专题迷你研讨会的主题。
尽管直接将精英作为调查受访者或实验对象进行研究的想法可以追溯到政治科学更早的时期(早期例子见Miller & Stokes 1963, Putnam 1976, Oldendick & Bardes 1982),但近期对微观基础、因果识别、调查与实地实验的关注以及对领导者普遍兴趣的增强,大大增加了政治科学研究中精英主体的使用。在美国政治研究中,学者们转向政策制定者样本来研究支出优先事项(Arceneaux et al. 2018)、立法者对公众意见的运用(Butler & Nickerson 2011)、面对事实核查的反应(Nyhan & Reifler 2015)。比较政治学家利用精英群体的调查实验来研究发达国家和发展中国家中的动机推理(Baekgaard et al. 2019)、风险倾向(Linde & Vis 2017, Heß et al. 2018、Sheffer & Loewen 2019)、议题建构(Walgrave et al. 2018)。在国际关系领域,学者则借助精英样本探讨了诸如对代价高昂信号的认知(Yarhi-Milo et al. 2018)、对国际法义务的认知(Bayram 2017)、以及对待武力使用的态度(Tomz et al. 2020)等问题。在政治科学之外,经济学家和心理学家的研究也出现了类似的热潮,尤其是在涉及专业知识和领导力问题(例如Potters & van Winden 2000, Palacios-Huerta & Volij 2009, List & Mason 2011, Banuri et al. 2019)、支配地位、等级和权力心理(Sherman et al. 2016, van der Meij et al. 2016)等领域。
本文旨在回顾并评估这些研究方法的优点和局限性。由于篇幅限制以及已有诸多优秀综述文章详细讨论了各类精英研究,包括政治制度领域的田野实验(Grose 2014)、审计研究(Costa 2017)以及针对精英群体的调查和访谈方法(Rivera et al. 2002; Hoffmann-Lange 2007,2008年;Rodríguez-Teruel & Daloz 2018),我们主要关注的是由实验者随机分配治疗条件的政治精英样本实验。因此,我们将大量用于描述目的的精英调查文献暂时搁置,转而专注于通过精英样本进行因果推断的实验研究,例如分析顶层1%的政策偏好(Page et al. 2013年、政治科学家对民主倒退的认识(Carey et al. 2019)或者不包含实验操纵的模拟战争游戏(Lin-Greenberg et al. 2022)等。考虑到研究政治精英时面临的独特后勤挑战中包含了招募和准入问题,我们的讨论特别聚焦于那些受访者知道自己正在被研究的实验类型,从而将未意识到自己为研究对象的审计或田野实验放在一边(这些问题已在其他最近的综述中得到解决,如Butler & Crabtree 2021)。然而,以下许多观点同样适用于精英实验和调查研究。
首先,我们基于过去20年间“三大”政治学期刊中精英实验的定量文献搜索提出几项观察,并通过更广泛的讨论阐明迄今为止该文献中出现的一些挑战。我们认为,当精英研究直接测试与精英特定领域专业知识和经验相关的理论时最为有用,但单纯使用精英样本并不能解决关于普遍性的疑虑。其次,我们提供了一个思考精英实验概念问题的框架,列举了三种不同的精英定义——职业型、构成型和认知型——并提供了一份清单,以帮助学者回答其理论如何映射到样本的相关问题。我们利用这些区分提出何时精英研究具有特别的价值,并建议学者如何将精英研究整合到他们更广泛的研究设计中。特别是,我们提倡所谓的“互补设计”,即学者同时开展针对大众和精英样本的研究,但每个样本用于测试理论的不同组成部分。最后,我们提供了一种实用的讨论,关于如何研究精英,重点关注如何招募精英受访者、如何看待代表性问题以及如何在无法接触精英本身的情况下,通过实验来研究精英。将精英特性融入实验设计不仅降低了研究政治精英的门槛,还为深入探究使精英与众不同的特质提供了额外的因果影响力。
精英实验的兴起
长期以来,在政治科学领域,精英和大众的研究采用了非常不同的方法(Kertzer & Tingley 2018)。20世纪30年代民意调查的兴起(Moyser & Wagstaffe 1987, p.5)以及制度主义研究方法的流行(Ricart-Huguet 2019),使得对政治精英的研究兴趣有所减弱,主要原因在于一种假设认为调查方法更适用于研究大众的政治行为——尽管有人提出某些精英群体比其他群体更容易接触,例如州级而非国家级立法者(Maestas et al. 2003)。因此,政治科学家利用了几乎所有其他的方法和数据来源来研究精英,包括演讲、日记和自传(George & George 1964)、投票记录(Poole & Rosenthal 1997)、认知地图和操作代码(George 1969, Axelrod 1976)、立法者和外交官的参与观察(Fenno 1978)以及开放性或半结构化访谈(Zuckerman 1972)。直至今日,学者们仍在持续使用一系列多样的方法研究领导者,比如基于文本的方法远程研究精英个性(Ramey et al. 2016)、档案资料法(Saunders 2011, Yarhi-Milo 2018)、生平研究法(Goemans et al. 2009, Fuhrmann & Horowitz 2015, Krcmaric et al. 2020)、民族志方法(Neumann 2012, Bussell 2020, Nair 2021)以及网络分析方法(Keller 2016, Mahdavi et al. 2017)。
过去几十年的一个显著趋势是精英调查和实验的兴起。为了描绘政治科学中精英实验的发展趋势,我们进行了定量文献回顾,手动收集了2000年至2020年间在《American Journal of Political Science》、《American Political Science Review》和《Journal of Politics》上发表的所有实验文章的信息。在这20年期间,这三个期刊共发表了501篇文章,包含了914个实验;其中76个实验是在精英样本上进行的。图1显示,虽然在这三个期刊上发表的针对精英样本的实验数量相比非精英样本(如全国代表性大众样本、通过亚马逊Mechanical Turk招募的便捷样本、学生样本等)的巨大增长显得较少,但从2015年开始,精英实验的数量明显增加。图2表明,这些期刊上发表的精英实验与非精英样本实验在多个方面存在差异:例如,精英实验往往具有显著较小的样本规模,且并不特别聚焦于美国政治。图3a显示,精英实验通常采用多种实验方法:尽管精英和非精英实验中最多的都是调查实验,但实地实验和审计实验在精英实验中比在非精英实验中更为常见(考虑到非精英审计研究的样子,这一点并不令人意外)。鉴于将精英引入实验室的难度,此期间在这三个期刊上发表的实验室实验均未针对精英进行——尽管在同一时期内其他期刊上确实发表了关于精英的实验室实验(如Butler & Kousser 2015, Renshon 2015)。
图1:对2000年至2020年《American Journal of Political Science》、《American Political Science Review》和《Journal of Politics》上发表的实验的分析表明,从2014年开始,精英实验的数量有所增加。我们这里的分析单位是实验(而不是文章)。
图2:2000年至2020年间,在《美国政治科学杂志》、《美国政治科学评论》和《政治学杂志》上发表的精英与非精英实验在样本规模和子领域方面的差异如下:面板a通过箱型图叠加小提琴图的方式展示了密度分布,显示精英实验(蓝色)的样本规模通常小于非精英实验(红色)。面板b展示了不同政治科学子领域中已发表的精英实验(蓝色)和非精英实验(红色)的比例,表明相较于非精英实验,精英实验在研究内容上对美国政治的侧重程度较低。
图3:2000年至2020年间,在《American Journal of Political Science》、《American Political Science Review》和《Journal of Politics》上发表的精英与非精英实验在实验类型及招募方法方面的差异显示:面板a展示了按实验类型划分的精英实验(蓝色)和非精英实验(红色)的比例,显示出相较于非精英实验,精英实验在调查实验和实验室实验上的主导程度较低。面板b展示了按照招募方法划分的精英实验(蓝色)和非精英实验(红色)的比例,表明在精英实验中,受访者更倾向于直接由研究人员招募,而非精英实验中的受访者则不然。
正如预期,精英研究在招募的精英类型方面也表现出广泛的变化:从加州学校董事会成员(Flavin & Hartney 2017)到国际公司服务提供商(Findley et al. 2017b),再到环保非政府组织的活动家(Hafner-Burton et al. 2016)、政治科学家和历史学家(Tetlock & Lebow 2001)、越南立法者(Malesky et al. 2012)等。虽然有关政治科学精英实验的文献大多以美国为中心,但在这三个期刊上发表的精英实验中只有43%在美国政治精英群体中开展。
在实施研究的方式上也存在重要差异。一个区别是补偿问题:93%的大众样本实验报告为参与者提供了补偿(或者在可以推断提供补偿的平台上进行),而只有3%的精英样本实验提到为参与者的时间支付了报酬。另一个区别在于招募方式:如图3b所示,最常见的大众样本实验通过在线调查小组招募受访者(占比51%),而最常见的精英样本实验则是通过电子邮件邀请来招募受访者(占比50%)。无论是针对大众还是精英的实验,尤其是针对精英的实地实验,实验者通常也会与当地组织合作来招募受访者。
在我们调查的大多数文章中,研究仅针对大众或精英样本进行,但有20%包含精英样本实验的文章同时也包含了大众样本实验,通常是为了测试这两类群体之间的差异(Kertzer 2022)。精英实验在关注与精英特定领域专业知识相关问题的程度上也有所不同。许多精英实验检验的是与所研究特定精英群体相关的理论,例如Broockman等人(2019)使用技术创业者的样本,表明他们在政府监管问题上的立场比其他政治态度预测的更为保守。其他研究者则利用精英样本探讨关于精英认知的更普遍性问题,如Sheffer等人(2018)检验了判断和决策文献中识别出的常见偏见是否出现在国家和省级政客样本中(Linde & Vis 2017)。
鉴于通常认为精英是一个难以接触的群体(例如Hafner-Burton et al. 2013),值得注意的是报告的精英回复率往往相对较高。在我们的样本中,89%的精英实验提供了其回复率信息,平均回复率为40%。虽然这一数字低于样本中大众实验报告的平均回复率(55%),但只有25%的大众实验报告了回复率。在线开展的调查实验的回复率往往是未知的或定义不清的,而通过电话进行的调查的回复率相对较低;Kennedy & Hartig(2019)在2019年报告说,皮尤研究中心的电话调查平均回复率仅为6%。重要的是,在不同类型精英实验的回复率方面也存在显著的异质性:针对政治精英的实地实验报告的回复率或完成率相对较高(平均为65%),而针对政治精英的调查实验报告的回复率则要低得多(平均回复率为28%;对于美国政治精英的调查实验,平均回复率仅为15%,并且联邦层级精英的调查回复率通常低于市县级精英)。
政治精英研究中的挑战
政治科学中的精英实验已经带来了实质性的实证和理论进步。毋庸置疑,随着学者们利用日益复杂精良的实验设计以及研究生阶段更为先进的方法论训练,精英实验也从中受益。然而,在政治科学中对精英使用的加速并未伴随着足够的关注,关于如何最有效地将精英受访者融入我们的研究设计,以及如何通过精英研究推动该领域知识的进步等问题并未得到充分探讨。这种忽视导致了关于如何最高效设计并从精英实验中学习的三类问题。
首先,谁算作政治精英?政治科学家使用这一术语来指代一系列广泛的行动者,从学者、智库成员、地方精英到总统和总理。无论在子领域内部还是跨子领域之间,对该术语的使用存在显著差异,这些不同的术语边界反映了对“精英性”非常不同的理解,这些理解对于如何最恰当地利用实验服务于我们政治学理论的检验具有深远影响。加剧这些问题的是,在讨论我们的精英样本与理论契合度方面的倾向性忽视。
其次,对现有文献的回顾表明,有关精英主体如何适应更广泛的研究设计,尤其是如何最有效地利用它们服务于理论测试和探究一般化的问题上存在一定程度的不确定性。即使在精英实验的萌芽阶段文献中,沿着这些维度也有巨大的变化,包括同时在精英和大众群体上开展配对实验的设计(Renshon 2015, Renshon et al. 2022)、不同精英样本间的比较(Sheffer et al. 2018)、使用精英进行概念复制的设计(Kertzer et al. 2021b),用于测试不同微观基础集的设计(Tomz et al. 2020),或者作为包含观察数据的更大设计的一部分(Hertel-Fernandez et al. 2019)。因此,有待辩论的问题是:鉴于样本规模和设计上的限制,精英实验本身是否足以进行理论检验;何时值得付出额外的后勤努力去实施它们;是否应将其视为更大研究设计的一部分,并且这样的设计可能是什么样的。
第三组挑战涉及精英实验中的准入和设计,特别是获取精英群体的途径以及针对这个特殊环境下的设计考虑因素的指导。尽管已有不少提供相关建议的专门领域,但这些大多集中在接入本身而非实验设计考量(这一类别涵盖了关于这些研究如何融入更广泛研究议程的讨论),并且过度关注样本规模而忽视其他因素可能会偏离要点。毕竟,如果更直接地检验理论或更好地补充项目中其他的实证部分,简单、小规模的实验可能比庞大复杂的实验更具说服力;即使是一个高层级精英样本也无法弥补无法准确模拟其旨在阐明的决策过程的设计缺陷。此外,现有的操作指南往往针对相对狭窄的精英亚群体和政治科学子领域定制,当这些建议被整合为面向更广泛受众时,可能导致不必要的混淆。例如,关于补偿问题,根据所阅读的内容,它要么对于提高参与率至关重要,要么是对潜在精英参与者的一种侮辱,要么一开始就没有特别的效果。
在下文讨论中,我们将逐一讨论每个挑战。
谁算精英?
在政治精英研究中的一大挑战是对谁算作政治精英存在广泛的分歧(Putnam 1976, Moyser & Wagstaffe 1987)。政治科学家在使用“精英”这一术语时表现出很大的灵活性,将其应用于企业高管(Teigen & Karlsen 2019)、军事官员(Lin-Greenberg 2021)、拥有经济学博士学位的教授(Fatas et al. 2007)、从高级管理人员培训项目中招募的政府和军事人员混合群体(Carnevale et al. 2011, Renshon 2015)以及当选政客(Kertzer et al. 2021b)。定义上的分歧至关重要,因为对精英概念的理解直接影响精英调查或实验应如何设计,以及研究结果是否能够跨研究进行整合。如果以权力来定义精英性,那么军事将领可被视为精英,但军校学员可能不算(Jost et al. 2022);而如果我们以特定领域的专业知识来定义精英性,则国际关系学者在外交政策背景下可视为精英(Busby et al. 2020a),而城市议员则可能不是(Baekgaard et al. 2019)。此外,一个子领域认同的观点在另一个领域可能并不相关,例如,“地方精英”——如Auerbach & Thachil(2020)研究的印度贫民窟领袖——在美国政治和比较政治学研究中有其意义,但在国际关系背景中通常不太重要。
文献中大致有三种不同的方式来概念化精英,我们将其分类为职业模型、构成模型和认知模型。职业模型将政治精英视为由于其制度角色赋予他们更高程度公共政策影响力的行动者:总理、立法者、公务员、官僚、外交官、军事官员等(Putnam 1976, Bussell 2020)。例如,Lasswell(1952)将精英定义为“社会中占据高位的人”(第6页),并将政治精英定义为“政治实体中的权力持有者”(第13页)。在这种观点下,精英并非具有独特特质,而是恰好占据了独特的职位。相反,构成模型将精英视为可以通过人口统计类别识别的独特阶层,并关注定义他们的社会经济特征。相比普通大众,政治精英往往更富有、受教育程度更高、年龄更大且更可能是男性;在西方语境中,他们也更有可能是白种人(Carnes & Lupu 2015, Bahador et al. 2019, Gerring et al. 2019)。第三种是认知模型,强调精英所拥有的独特认知特质集合,有时被概念化为特定领域的专业知识或经验(Hafner-Burton et al. 2013, Saunders 2017)。例如,Carnevale 等人(2011)发现领导者在决策能力上高于匹配对照组,而Dal Bó 等人(2017)则显示当选政客往往有一套不同于全体公众的性格特征。在许多这类研究中,不仅是精英碰巧拥有如特定领域专业知识这样的特质,而是这种特定领域专业知识被认为构成了成为精英的本质属性(如Hafner-Burton et al. 2013)。
这里有三点值得注意:首先,这些对精英性的不同表述在概念上相互交织。例如,在研究政治行为中关于精英暗示的理论,从职业角度操作化政治精英,视之为“全职致力于政治或公共事务某个方面”的人,这个群体包括“政治家、高层政府官员、记者、一些活动家以及多种类型的专业人士和政策专家”(Zaller 1992,第6页);然而,正是因为他们被认为具备特定领域的专业知识,所以他们的声音才被认为具有重大影响力(Lupia & McCubbins 1998)。同样,关于政治选拔和潜在政治抱负的研究(Dynes et al. 2021, Gulzar 2021)经常关注在探讨谁决定参选及哪些竞选最终成功的过程中,构成和认知因素之间的互动。
其次,这些观念在实践层面上也是相关的:精英样本常常以结合多个类别的方式进行打包。这尤其体现在长期运行的精英小组中,比如芝加哥全球事务委员会领导调查,该调查由行政和立法部门的受访者、外交政策智库成员、劳工与宗教领袖、商业官员和学者组成(Busby et al. 2020a,b)。而在学者编纂的受访者池中也是如此常见。为了说明被认定为精英的人群范围广泛,我们可以注意到Renshon(2015)使用了哈佛肯尼迪学院执行教育项目抽样以及匹配对照组,结果显示两组在主观感受和客观权力衡量标准上均高度重叠。令人安心的是,领导者在两个指标上平均得分更高,但重叠分布表明至少某些样本可能不如我们想象的那样精英化,而根据我们关心的精英性哪个方面,有时更为传统的非精英样本也可能同样适用。
最后,这些对于精英性的迥异理解很可能反映了两个因素:一是学者为何首先研究精英的原因存在差异,二是实际研究条件的限制。在某些情况下,我们通过调查政治精英或对他们进行实验来测试其中精英作为关键行动者的理论(Humayun 2021)。在其他情况下,我们的理论更具一般性(尤其是在建立在社会和认知心理学理论基础上的工作中),我们关注的是考察精英是否也按照理论所建议的方式行动或思考(Sheffer et al. 2018)。还有其他研究侧重于识别精英性对行为的影响,经常采用政治精英和平民对照组配对样本(Yarhi-Milo et al. 2018)。此外,样本规模的实际需求经常促使不同类型的精英(具有不同程度的精英性)被捆绑在一起,以缓解关于统计功效和响应率的担忧。虽然三种精英观都有其价值,但职业观和构成观描述的行动者更容易让研究人员招募(例如,高学历者),或者通过在研究设计中融入精英环境的特点来模拟(如下文详细讨论)。
对精英身份认定的广泛差异具有实际影响。一方面,更为宽泛的精英观允许更大的样本规模、更强的统计功效和更复杂的设计,从而加快实验的实施和发表速度,促进不同研究领域的知识积累。然而,在缺乏明确界定精英的标准以及对任何特定研究中精英样本目的的清晰期待的情况下,这些高度异质化的样本有时可能会引发不必要的混淆。因此,首先提供一个关于精英性的清晰概念是必要的。现有的定义要么针对性很强但局限于某一子领域,要么过于笼统以至于为大多数研究人员提供的实践指导有限。我们认为最有效的方法不是制定一种适用于所有情况的精英性定义,而是一份清单,列出从事政治精英研究的学者在工作中应明确的内容。致力于政治精英研究的学者应当:
明确指出在其所研究问题中哪些是相关的政治精英。
指出其受访者在哪些维度上可被视为精英。
明确评估其理论关注的精英与实证研究中的精英之间的契合程度。
对于组合样本,应透明地描述样本构成。
澄清什么特质将被试者识别为精英,有助于该领域实现更高的透明度,从而更容易积累知识,并对研究人员带来好处,因为所能接触到的精英类型会影响从招募过程(例如,针对国家安全专业人士的最佳招募实践可能与针对学术界或富裕公民的招募方法大相径庭)到研究设计的方方面面(如所研究的精英群体类型可能会影响应测量哪些协变量以及选择什么样的实验刺激是合适的)。同样地,澄清一组特定精英如何与理论相匹配也会给研究人员带来相应的好处,因为它鼓励更清晰地规定整体研究设计考虑因素,特别是实证检验与理论的契合程度。
例如,测试国会响应公众意见理论的美国政治实验者通过调查包含联邦级政客但在很大程度上由地方和州立法者组成的异质性政治精英样本时,可以指出他们的样本中包括一些完全符合理论基础(基于他们在国会的经验)的行为者,但也包含了因其一般政治职业而成为精英的受访者。国际关系领域的实验者通过调查前国家安全官僚样本来测试总统决策理论时,可能注意到采样的精英具备相关领域专业知识,是通过他们先前的职业身份确定的,并且与理论有相对接近的匹配。这些作者还应补充说明,前官僚与高票当选的领导人可能在某些理论上重要的维度上存在差异,并指明这些差异可能对所作推断产生的影响。类似地,即使作者能够邀请前总统参与研究,实验设计仍不可避免地简化了现实情况(例如,场景中缺乏时间压力和利益性质)。
如何在更广泛的研究设计中利用精英实验
在何种条件下,精英实验更可能产生有价值的推断并推进我们对该领域的认识?关于这个问题有两种思考方式:一种是关注精英研究这一较窄的概念何时特别有价值;另一种则是对这些研究如何融入更大的研究设计中,从而达到整体大于部分之和的更为宽泛的表述。接下来我们将逐一讨论这两种思考方式。
(一)精英研究何时有价值?
精英实验通常提供的两种合理依据是实质性论证和方法论论证。实质性论证关注的是特定研究是否为某个理论提供了进一步的支持或反驳证据;而方法论论证则涉及外部效度的概念,即研究发现能否推广到其他环境或群体的程度(McDermott 2011)。这两种理由在孤立状态下都是合理的——谁能反对通过在独特样本上复制以增加研究发现的外部效度呢?——但在判断一项提议的精英研究相对于替代方案的相对价值时,它们的帮助并不大。为此,我们借鉴经典的OTUS(结果、处理、单位、设置)框架(Cronbach & Shapiro 1982,参见Findley et al. 2021),提出了一种更为系统的分析精英研究价值的方法。下面我们将重点讨论其中两个维度:处理和单位。
有助于明确精英研究价值的第一个维度是实验处理本身。我们认为,精英研究特别具有信息量的地方在于它们检验了直接与精英的领域特定专业知识和经验相关的理论。例如,如果我们预期精英的认知优势之一是他们能更有效地利用启发式(Hafner-Burton et al. 2013),那么在那些启发式应具体体现的任务上进行模拟的实验将最为有用。这是一个相对容易满足的条件,因为大多数精英实验测试的理论要么直接涉及精英,要么对我们对精英行为、判断、偏好等方面的期待有所暗示。政治科学中有一小类精英实验针对的是更为普遍的行为或心理学理论,这些研究几乎完全基于方法论的理由。启发式决策制定理论并未表明精英和非精英使用启发式的可能性会有所不同,因此将此类研究扩展至精英群体的研究(如Stolwijk & Vis 2020)主要受外部效度考虑驱动(这一传统可追溯至将行为研究拓展到非典型样本的历史,如Gigerenzer & Kurzenhaeuser 2005)。
其次,当被研究的精英群体(即单位)最接近理论所隐含的目标人群时,精英研究最有价值。单纯使用精英作为研究对象很少能解决外部效度问题——无论如何,外部效度最好被视为研究项目而非单个研究的属性——但如果研究对象与理论中的行动者相符合,则具有一定的价值。至于在哪些方面应该相符,当然取决于理论本身以及研究者对精英性的理解。对某些研究者而言,特定领域的知识至关重要;而对另一些研究者来说,精英性可能是通过人口统计学甚至心理变量赋予的。关注给定理论中的行动者与样本之间的对应关系本身就是有价值的,而且这还进一步澄清了即使使用精英样本时也必须进行外推的重要性。例如,在国际关系领域许多精英实验是在立法者(Findley et al. 2017a)或中层军事官员(Mintz et al. 2006)样本上进行的,虽然他们比大学一年级学生更具精英性,但仍然远离了在大多数外交政策决策过程中发挥核心作用的行政高层成员(Saunders 2022)。
评估研究中的精英样本与理论中行动者之间的对应性不仅需要识别理论中的精英群体,还需要证明样本中的精英能够代表更广泛的总体。这一问题通常被讨论为响应率问题,不同研究方式下的响应率有所不同,其中面对面研究的响应率最高(Vis & Stolwijk 2020)——但即使高响应率也不能必然表明代表性,而且对于不同类型精英群体而言,评估这一数量的难易程度也各不相同。当针对来自明确定义群体的高级别精英进行调查或实验时,如以色列现任和前任议员(Renshon et al. 2022),由于存在可获取的基准,相对容易评估受访者代表性。例如,立法者的传记和人口统计数据往往公开可用,这使得研究人员可以比较参与调查的立法者(样本)在可观测特征上与抽样框架及全部立法者总体的相似度。相比之下,对于中层官僚、军事官员或地方精英样本的传记数据则不太可能获得。对更为显赫的政治精英的传记和人口统计数据的获取也有助于领导力研究中采用传记方法的研究(Krcmaric et al. 2020)。这是因为研究人员可以将他们在研究之外收集的额外观察或行为测量指标补充到从精英参与者那里收集的数据中,从而使用较短的调查工具,并提高忙碌的精英参与的可能性。当然,这也带来伦理挑战;在针对明确定义群体内的高级别精英开展调查或实验的研究人员,在发表复制数据时通常不能包含个体层面的人口统计协变量信息,以免意外地重新识别出受访者身份。
(二)将精英研究融入研究设计
与精英研究是否值得投入精力这一问题紧密相关的是一个更广泛的问题,即如何将精英研究融入更大的研究设计中并与其它实验或非实验部分相结合。包含精英的研究设计可以从多个维度进行分类。对于包含多个实验的项目来说,关键特征之一是是否在精英和非精英样本中实施一套共同的处理方式,从而允许对两者进行直接比较。关于不同方法整合的其他思考方式包括:观察性数据是否产生某种发现进而激发了精英实验,或者观察性数据是在实验执行后收集的,以展示在不同(非实验)背景下的相似模式或探索由实验结果所暗示的机制。以下我们将讨论每种方法。
一种日益普遍的方法是将精英研究与其他针对精英或大众样本进行的实验研究结合使用。其中一些研究包括配对实验,在这种实验中,精英和大众样本同时接受重叠的处理集和结果度量,以测试大众样本中观察到的模式是否同样适用于精英样本(Kertzer 2022)。例如,Teele等人(2018)在美国地方及州级立法者以及美国大众群体中开展联合构念实验,来研究候选人在性别偏好上的偏见。另一些例子是概念复制,如Karpowitz等人(2017)的工作,他们结合了对共和党区主席的实地实验与对共和党初选选民的调查实验,以测试政党领导人的信息如何影响女性候选人的选举成功。另一种将精英研究纳入大型研究设计的方式是互补实验,在这种方式下,分别对大众和精英样本施加不重叠的处理集合/结果度量,反映每个参与者在政治中的不同角色。例如,Butler & Powell(2014)在选民中进行调查实验,研究他们对政党品牌的反应,并同时在州议员中进行调查实验,观察政党品牌如何影响议员的投票行为。
尽管有针对性的对比具有实用性——既有利于复制的基本目的,也有利于探讨精英与大众公众之间的差异,但仍需谨慎对待。配对研究的一个常见特点是强调所考察精英与大众公众的不同之处。Dietrich等人(2021b, p.598)指出,学者们应该“考虑投资于精英实验,恰恰是因为研究表明精英的行为从根本上不同于非精英”。确实,很容易在配对设置中找到精英与非精英样本之间存在差异的证据,比如Mintz等人(2006)的研究,他们在一个决策制定实验中比较了军事精英与大学生群体。然而,正如Kertzer(2022)所指出的,在配对研究中,精英身份本身从未被因果识别出来。这意味着学者有时会过度解释精英与大众样本之间的差异,将效应归因于特定领域的专业知识,而这些差异可能实际上是由构成差异(例如,许多国家的精英样本通常由较年长、富裕的男性组成)造成的。此外,研究者有时未能区分截距差异与斜率差异,他们关注的是两组在结果变量上平均差异,而不是该结果变量受治疗本身的效应是否真的在两组间存在差异。这些倾向可以说已经歪曲了我们从许多这类研究中得出的结论。
其他研究则将精英实验与各种非实验数据相结合,这些非实验数据可以在实验实施前或实施后收集。其中一种设计类型是利用观察性调查数据通过揭示政治结果的差异来激发对问题的关注。例如,Flavin & Hartney(2017)对加利福尼亚州学区委员会选举的分析发现相关性证据表明,只有当学区内的白人(而非少数族裔)学生学业成绩低时,学区委员才会在选举中受到惩罚。作者使用这一发现作为动机进行列表实验,从而获得因果证据证明选举压力取决于受影响学生群体的种族。
在其他情况下,观察数据的分析旨在事后构建于实验发现之上,通常通过展示在实验环境之外存在相应的实证模式。例如,Hemker & Rink(2017)运用联合构念实验展示了在德国福利办公室中,针对德国公民和非德国公民的请求响应率并无显著差异,但非德国公民收到的回复质量较低。这一模式通过比较由地方政府运营的福利办公室(而不是国家官僚机构)的观察数据得以验证,显示了类似的歧视现象。其他研究者则结合精英实验与诸如定性内容分析等非实验来源的数据,以探索其理论的更多含义(Distelhorst & Hou 2017)。此类方法的不同变体还采用了巧妙的设计,即对立法者施加处理,并利用公开可用的支出和议会出席数据来衡量结果(Ofosu 2019)。
在精英实验中的准入与设计
精英实验面临的核心挑战之一与设计和招募有关,尤其是正如定量文献回顾所示,进行精英实验的研究者相较于研究大众群体的研究者更可能亲自招募参与者。然而,诸如CivicPulse等公司的兴起改变了这一局面,这些公司维护着(通常是地方)政治精英的面板,研究人员可以付费获得准入权限(例如Shaffer et al. 2020)。这种趋势预示着未来可能会出现更为成熟完善的精英研究基础设施。
(一)招募
多年来,从美国政治调查研究或访谈视角,以及机构研究中的实地实验角度撰写了许多实践指南,这些指南对于精英招募和访问问题具有指导意义。综合来看,各方在以下四个领域达成了共识:
与精英受访者建立首次联系至关重要(Goldstein 2002; Dahlberg 2007; Efrat 2015)。
研究者应当多次跟进他们的精英受访者(Vis & Stolwijk 2020)。
为了增加样本量,研究者应自始至终直接处理匿名性和研究持续时间的问题(Goldstein 2002; Dietrich et al. 2021b)。
研究者应仔细考虑精英群体能从研究中获得什么好处,比如针对他们决策制定的个性化反馈(Carnevale et al. 2011),或是对整体研究结果的简报(Dietrich et al. 2021b)。
在其他领域如是否适用激励及何种类型的激励方面,意见不一。Dietrich等人(2021b)建议使用金钱激励,而Godwin(1979)报告称金钱激励并未增加通过邮寄调查作出回应的精英样本数量。此外,一些精英可能有不能接受报酬的规定(Dietrich et al. 2021a),或者认为金钱激励是侮辱性的(Renshon 2015)。关于诸如强制选择设计是否会惹恼精英这样的问题,也存在不同的建议——尽管Godwin(1979)对此有所安慰,Maestas等人(2003)仍认为强制选择设计会令人反感。另外,在进行研究前是否应寻求精英群体领导者的批准(例如当地主席或政党领袖),也有不同的观点。Dietrich等人(2021b)认为接触领导者可以得到他们的认同,而Vis & Stolwijk(2020)则强调如果领导者拒绝合作,研究人员可能会失去大量受访者。
另一个相关问题是“污染先验信息”这一风险在涉及精英受试者时是否比其他群体更为突出。政治科学家在这个关于欺骗的辩论中处于尴尬的中间位置,心理学家和经济学家分别代表了对立的两极。简单概括McDermott(2013)的观点,心理学家倾向于认为少量的欺骗并无大碍,并发现受试者甚至更喜欢参与使用欺骗的研究(Sharpe et al. 1992),而经济学家通常禁止欺骗,认为它会产生怀疑(Ortmann & Hertwig 2002)并影响未来研究的参与选择(Jamison et al. 2008)。虽然目前尚不清楚总体上“污染先验信息”的危险程度有多大,但可以想象的是,如果相对于大学生或MTurk样本,精英更加关注或拥有更多互联的社会网络,那么任何在一般人群中可能出现的溢出效应都可能被放大。精英还存在额外的担忧,作为知名人物,他们可能担心遭遇让大学生不会遇到的尴尬情况。在我们的经验中,我们曾遇到过了解过去使用欺骗方法的研究的政治精英,以至于即使我们在实验室标明这是“无欺骗实验室”,我们也很难说服潜在的精英受访者相信我们不会使用欺骗手段。
人们希望基于系统实证工作的更多指导,而非基于为什么某种方法有效而另一种无效的轶事和直觉。因此,我们鼓励研究者在其研究中纳入不同精英招募策略的效果评估操纵变量,将激励的存在、后续联系和非金钱补偿作为次要研究对象进行变化。在出现此类评估之前,研究者只能参考一系列有用的轶事和经验,以应用于自己的研究。考虑到精英研究的异质性,研究者不应盲目采纳其他精英研究的招募协议,而应主动寻求反馈并与相关精英群体进行讨论。几乎无法预先判断特定子群体可能存在哪些约束或期望——在研究型大学执行教育项目中的军方官员与他们在日常工作中所面对的补偿期待就有所不同——因此,在招募精英样本的过程中,进行试点和倾听反馈的需求可能比其他招募工作更为强烈。
(二)样本量和代表性
精英样本最显著的特点对设计具有最大的影响。如我们在文献回顾中所指出,精英样本通常比大众样本规模小且更难以获取,从而增加了成本,有时甚至阻碍了后续研究的进行。为了增加精英研究中的样本量,学者们常常采用的一种技术是获取多种类型的精英群体的异质样本,通过聚合多个精英群体来实现。例如,在美国政治领域,调查实验经常在地方、州和联邦立法者的合并样本上开展(Teele et al. 2018),或是在立法者与工作人员混合的样本上实施(Malhotra et al. 2019)。在国际关系领域,实验主义者有时会在外交政策建制派或外交政策意见领袖群体上进行研究,这让人联想到从国会到智库再到商界领袖乃至学术界的“Blob”概念(Busby et al. 2020a; Kertzer et al. 2021a)。总体而言,这些研究发现不同精英类型之间处理效应的异质性证据并不多(Gift & Monten的2021年研究是一个例外),尽管其中许多子集相对较小。
然而,权衡无处不在:尽管跨不同类型精英群体整合样本具有固有优势,且目前尚无证据表明这样做会导致研究内部处理效应的异质性,但诸如公务员、前立法者及职员和企业高管等混合组成的精英异质样本(Hafner-Burton et al. 2014)使得评估代表性变得更加困难。在一个由异质精英组成的样本中,研究者应按照各精英群体平等地加权,还是依据其他人口基准?如果研究者选择后者以估计总体平均处理效应,则需谨慎行事,但已有方法可以估算保守界限(Miratrix et al. 2018)并透明地描述这些选择(Franco et al. 2017)。因此,正如所有其他方法一样,使用精英实验和调查的研究者面临艰难抉择,必须同时平衡多个考量因素。高级官员可能较少参与研究,但研究人员更有可能收集他们在研究之外的观察性或行为数据,并将其纳入分析,而低级官员则不然。低级官员可能有更多时间配合研究人员,但他们身上的观察性/行为数据却不太可能获得。精英异质样本允许研究者通过获取更大的样本规模来增强研究的统计功效,但也使研究者更难评估样本对目标人群的代表性。
精英样本的特性——通常规模较小且获取成本较高——为我们的设计提出了一些最佳实践。例如,较小的样本意味着应当(a)进行更广泛的预试验以优化和精确化治疗方案,并在实地执行之前改进它们;(b)利用预试验数据生成统计功效的现实估计。后一个建议虽然常被提出,但实际上很少遵循(Sedlmeier & Gigerenzer 1989)。像DeclareDesign(Blair et al. 2019)这样的工具在这方面很有用,但其输出的质量取决于投入的准备工作;没有替代品能取代预试验的作用,它有助于选择和修改治疗方案以及明确研究各臂间的对比。考虑到精英样本较小且容易被“耗尽”,我们建议使用更容易访问的样本进行预试验,同时与少数精英进行非正式咨询,讨论样本特定问题。
当然,有些设计在样本规模小于理想值的情况下比其他设计更为高效。Yarhi-Milo等人(2018)在其以色列议会立法者样本上采用了内源设计,出于担心外源设计将需要远大于实际可行的大样本规模。在经济学实验背景下,Bellemare等人(2014)估计,要达到相同的统计功效水平,外源设计所需的受试者数量可能是内源设计的4至8倍。这种策略的一个典型担忧是“一致性压力”会降低处理效应,但Clifford等人(2021)表明,“重复测量设计”的内源和外源版本在精度和统计功效上都明显优于仅在处理后测量结果的传统设计。结合内源和外源设计的联合实验是一种常见方法,最近的进展表明,关于大量任务导致满足取向现象的早期担忧可能被夸大了(尽管这些设计确实使得分析子群体偏好比传统设计更加困难)(Leeper et al. 2020)。尽管如此,许多精英可能不愿意花费必要的时间让研究人员对他们进行包含大量选择任务的联合实验。
正如对诱发一致性偏差的担忧可能被过分夸大一样,关于设计各个方面元效应的其他研究表明,精英实验者不必过于谨慎。Mummolo和Peterson(2019)发现调查实验设计中的需求效应证据很少,这意味着研究者可以在精英研究中采纳Grose(2021)的建议,无需担心地使用“有意义、频率适中且大胆的干预”。另一个常见的关注点是,即使保证匿名性和不可识别的数据,某些主题对于精英受访者来说可能会特别敏感。在这种情况下,研究人员的直觉往往是设计他们的处理方式以避免引发不安或增加流失率,比如将情境设定为假设性质或将国家或行为体名称替换为代表类型的虚构名称。尽管一些学者担心假设性问题会产生假设性的答案,但Brutger等人(2022)表明,实验设计中的抽象化所涉及的权衡比人们普遍认为的要少。
(三)如何在无法接触精英的情况下研究精英群体
研究精英群体时的最后一个考量是如何在资源稀缺、接触高级政治精英成本高昂、不切实际或引发伦理问题(Nathan & White 2021)的情况下进行研究。对于可能无法接触到精英的研究者,有两种方法可以采用,分别涉及招募和设计阶段。
首先,在招募阶段,根据研究者的访问权限和资源情况,有几种选择。如果有一定程度接触精英的机会,第一个选项是将较小的样本结合使用,而不是等待获取一个大型且统一的精英受访者群体(例如,Teele et al. 2018; Kertzer et al. 2021a)。如上所述,目前使用精英混合样本的研究中尚未发现显著的异质处理效应证据,因此,聚合多个(较小的)精英样本是一种可行途径。另一种选择是扩大对精英定义的范围,超出理论直接规定的范畴:比如,国际关系学者可以考虑使用退役军官、参加预备役军官训练团项目的人员或专业军事教育项目中的军官(例如,Friedman et al. 2017; Jost et al. 2022);比较学者则可拓宽视角,不仅关注现任立法者,还考察前立法者——尽管如果立法任期之间存在明显的政党变动,应谨慎对待。如果精英模型更接近关注精英社会经济特征的组成模型,则年龄较大、受教育程度较高、较富裕的受访者可能作为精英的合适替代。
连接招募与设计的一个相关方法是在研究环境中创建自己的精英群体。我们建议学者考虑理论上精英可能区别于非精英的关键维度,并将这些维度融入那些以非传统精英为对象的研究中。例如,一些认知模式认为精英性的一个关键方面是领域特定经验,此时研究者可以在实验室内通过培训使受访者成为本土专家。例如,Tingley(2011)比较了接受重复博弈讲座的学生与未经过指导的受试者的行为差异。其他关于精英性的模型提出,精英的心理特质系统地不同于非精英心理特质,这些特质可能包括耐心(Hafner-Burton et al. 2014)、更强的权利感(Renshon 2015)或其他因素。正如我们可以训练受访者并赋予他们所需的领域专业知识以使其更加专业一样,我们也可以通过激励或启动某些性格特质,理想情况下作为随机研究分组的一部分,以便恰当地识别传统受试者与被分配为精英之间的差异。这些方法的优点在于它们迫使研究者清晰阐述是什么让精英变得特别,并明确指出通常未明示的精英实验中的权衡。同时,它们提供了更多因果上的杠杆作用,以识别我们认为使行为者成为精英的特质、知识或经验的影响。
最后一种选项涉及到实验设计本身,适用于研究问题涉及决策者所处环境或背景特点的情况。学者们可以自问:实验测试中最重要的特征是否涉及决策者自身,还是与其作出决策的环境或背景有关?如果精英个体至关重要,那么上述选项可供研究者选择。而如果后者更重要,研究者可以将理论所暗示的环境特征融入实验设计中。例如,时间压力、群体过程、问责制和不确定性等环境属性都是精英决策过程中常被引用的因素,很容易被纳入实验设计之中。特别是在许多精英决策常常发生在小团体而非个体情境下(Saunders 2017;Kertzer et al. 2022),模拟群体动态具有特别重要的价值。
结论
在实验经济学的一部基础性文献中,Roth(1986)指出,实验室实验传统上有三种不同的目的:检验正式理论的命题、展示实证规律或“向王子耳边低语”。近年来,在社会科学领域出现了一个转变,实验者不仅寻求取悦高层决策者,还直接研究他们,在政治精英本身作为受访者的情况下开展实地实验。然而,精英研究的加速应用超出了我们对最佳实践的集体理解,这不仅涉及实施精英实验的后勤工作,还包括如何最有效地利用精英研究推进学科知识。
本文提出了若干建议。首先,研究政治精英的学者应当明确指出对于他们正在研究的问题来说,哪些是相关的政治精英,并论证为何所使用的精英样本非常适合测试其理论。精英研究最具价值之处在于被研究的精英群体与我们理论框架暗含的目标群体最为相似。然而,研究人员最有可能接触到的精英类型与许多理论关注的最终高级决策者之间往往存在脱节。清晰阐述我们的理论与研究对象之间的差距有助于增强研究发现的可信度。
其次,当精英实验旨在直接检验涉及精英特定领域专业知识和经验的理论时,它们具有特别重要的价值。从这个意义上说,呈现给受访者的处理方式与受访者本身同样重要。招募高阶政治精英样本并向他们呈现与其政治生活中执行任务无关的处理方式会导致推论帮助较小。
第三,应注意精英在更广泛研究设计中的作用。研究人员可以通过配对实验或互补实验的方式复制他们在精英群体上的研究,并在大众样本上进行同样的实验,从而测试一个更大理论框架的不同微观基础。类似地,研究人员可以将精英实验与非实验数据相结合,以激发实验设计或验证其实验结果。
第四,鉴于关于招募精英受访者最佳方法的矛盾轶事和直觉颇多,研究人员应考虑通过实验方式研究这一问题,这将提供不同招募策略、激励方案、后续联系以及非金钱形式补偿如何实际影响精英参与的数量和质量的更深入见解。
第五,正如所有实验一样,开展精英实验的研究人员面临着样本规模、精英属性和代表性之间的权衡:例如,异质性的精英样本通常较大,但可能有定义不清的人口框架;受访者越接近政治权力位置,用于研究的时间就越少,统计功效的关注就会变得越发紧迫。尽管一些包含内源组分的实验设计更适合小样本,但权衡仍然不可避免,因此,研究人员在设计研究时应明确说明他们是如何权衡这些因素的。
最后,鉴于接触精英样本的挑战,无法获得足够规模精英样本的学者可能希望考虑替代性研究设计,包括整合不同政治精英群体的设计,或是诱导随机子集受访者获得特定领域的专业知识的设计。以这种方式拓宽精英实验文献可能有助于提高知识积累的速度。
参考文献:
Arceneaux K, Dunaway J, Soroka S. 2018. Elites are people, too: the effects of threat sensitivity on policymakers’spending priorities. PLOS ONE 13:e0193781
Auerbach AM, Thachil T. 2020. Cultivating clients: reputation, responsiveness, and ethnic indifference in India’s slums. Am. J. Political Sci. 64:471–87
Axelrod R. 1976. Structure of Decision: The Cognitive Maps of Political Elites. Princeton, NJ: Princeton Univ. Press
Baekgaard M, Christensen J, Dahlmann CM, Mathiasen A, Petersen NBG. 2019. The role of evidence in politics: motivated reasoning and persuasion among politicians. Br. J. Political Sci. 49:1117–40
Bahador B, Entman R, Knüpfer C. 2019. Who’s elite and how the answer matters to politics. Political Commun. 36:195–202
Bansak K, Hainmueller J, Hopkins DJ, Yamamoto T. 2018. The number of choice tasks and survey satisficing in conjoint experiments. Political Anal. 26:112–19
Banuri S, Dercon S, Gauri V. 2019. Biased policy professionals. World Bank Econ. Rev. 33:310–27
Bayram AB. 2017. Due deference: cosmopolitan social identity and the psychology of legal obligation in international politics. Int. Organ. 71:S137–63
Bellemare C, Bissonnette L, Kröger S. 2014. Statistical power of within and between-subjects designs in economic experiments. Disc. Pap. 8583, Inst. Stud. Labor, Bonn, Ger.
Blair G, Cooper J, Coppock A, Humphreys M. 2019. Declaring and diagnosing research designs. Am. Political Sci. Rev. 113:838–59
Broockman DE, Ferenstein G, Malhotra N. 2019. Predispositions and the political behavior of American economic elites: evidence from technology entrepreneurs. Am. J. Political Sci. 63:212–33
Broockman DE, Skovron C. 2018. Bias in perceptions of public opinion among political elites. Am. Political Sci. Rev. 112:542–63
Brutger R, Kertzer JD, Renshon J, Tingley D, Weiss CM. 2022. Abstraction and detail in experimental design. Am. J. Political Sci. In press
Busby J, Kafura C, Monten J, Tama J. 2020a. Multilateralism and the use of force: experimental evidence on the views of foreign policy elites. Foreign Policy Anal. 16:118–29
Busby J, Kafura C, Smeltz D, Tama J, Monten J, et al. 2020b. Coming together or coming apart? Attitudes of foreign policy opinion leaders and the public in the Trump era. Policy Brief, Chicago Counc. Glob. Aff., Chicago, IL
Bussell J. 2020. Shadowing as a tool for studying political elites. Political Anal. 28:469–86
Butler DM, Crabtree C. 2021. Audit studies in political science. In Advances in Experimental Political Science, ed. JN Druckman, DP Green, pp. 42–55. Cambridge, UK: Cambridge Univ. Press
Butler DM, Kousser T. 2015. How do public goods providers play public goods games? Legis. Stud. Q. 40:21140
Butler DM, Nickerson DW. 2011. Can learning constituency opinion affect how legislators vote? Results from a field experiment. Q. J. Political Sci. 6:55–83
Butler DM, Powell EN. 2014. Understanding the party brand: experimental evidence on the role of valence. J. Politics 76:492–505
Carey JM, Helmke G, Nyhan B, Sanders M, Stokes S. 2019. Searching for bright lines in the Trump presidency. Perspect. Politics 17:699–718
Carnes N, Lupu N. 2015. Rethinking the comparative perspective on class and representation: evidence from Latin America. Am. J. Political Sci. 59:1–18
Carnevale JJ, Inbar Y, Lerner JS. 2011. Individual differences in need for cognition and decision-making competence among leaders. Pers. Indiv. Diff. 51:274–78
Clifford S, Sheagley G, Piston S. 2021. Increasing precision without altering treatment effects: repeated measures designs in survey experiments. Am. Political Sci. Rev. 115:1048–65
Costa M. 2017. How responsive are political elites? A meta-analysis of experiments on public officials. J. Exp. Political Sci. 4:241–54
Cronbach LJ, Shapiro K. 1982. Designing Evaluations of Educational and Social Programs. San Francisco: JosseyBass
Dahlberg S. 2007. Web-based expert surveys. QoG Work. Pap., Göteberg Univ., Sweden
Dal Bó E, Finan F, Folke O, Persson T, Rickne J. 2017. Who becomes a politician? Q. J. Econ. 132:1877–914
Dietrich S, Hardt H, Swedlund HJ. 2021a. Elite experiments: strengthening scholarship while bridging the gap. Duck of Minerva Blog, June 10. https://www.duckofminerva.com/2021/06/elite-experimentsstrengthening-scholarship-while-bridging-the-gap-2.html
Dietrich S, Hardt H, Swedlund HJ. 2021b. How to make elite experiments work in international relations. Eur. J. Int. Relat. 27(2):596–621
Distelhorst G, Hou Y. 2017. Constituency service under nondemocratic rule: evidence from China. J. Politics 79:1024–40
Dynes AM, Hassell HJG, Miles MR, Preese JR. 2021. Personality and gendered selection processes in the political pipeline. Politics Gender 17:53–73
Efrat A. 2015. Cross-national interviewing at international conferences: how to make the most of a unique research opportunity. Int. Stud. Perspect. 16:302–11
Fatas E, Neugebauer T, Tamborero P. 2007. How politicians make decisions: a political choice experiment. J. Econ. 92:167–96
Fenno RF. 1978. Home Style: House Members in Their Districts. Boston: Little, Brown
Findley MG, Harris AS, Milner HV, Nielson DL. 2017a. Who controls foreign aid? Elite versus public perceptions of donor influence in aid-dependent Uganda. Int. Organ. 71:633–63
Findley MG, Kikuta K, Denly M. 2021. External validity. Annu. Rev. Political Sci. 24:365–93
Findley MG, Laney B, Nielson DL, Sharman JC. 2017b. External validity in parallel global field and survey experiments on anonymous incorporation. J. Politics 79:856–72
Flavin P, Hartney MT. 2017. Racial inequality in democratic accountability: evidence from retrospective voting in local elections. Am. J. Political Sci. 61:684–97
Franco A, Malhotra N, Simonovits G, Zigerell L. 2017. Developing standards for post-stratification weighting in population-based survey experiments. J. Exp. Political Sci. 4:161–72
Friedman JA, Lerner JS, Zeckhauser R. 2017. Behavioral consequences of probabilistic precision: experimental evidence from national security professionals. Int. Organ. 71:803–26
Fuhrmann M, Horowitz MC. 2015. When leaders matter: rebel experience and nuclear proliferation. J. Politics 77:72–87
George AL. 1969. The“operational code”: a neglected approach to the study of political leaders and decisionmaking. Int. Stud. Q. 13:190–222
George AL, George JL. 1964. Woodrow Wilson and Colonel House: A Personality Study. New York: Dover
Gerring J, Oncel E, Morrison K, Pemstein D. 2019. Who rules the world? A portrait of the global leadership class. Perspect. Politics 17:1079–97
Gift T, Monten J. 2021. Who’s out of touch? Media misperception of public opinion on US foreign policy. Foreign Policy Anal. 17:128–39
Gigerenzer G, Kurzenhaeuser S. 2005. Fast and frugal heuristics in medical decision making. In Science and Medicine in Dialogue: Thinking Through Particulars and Universals, ed. R Bibace, JD Laird, KL Noller, J Valsiner, pp. 3–15. Westport, CT/Boston: Praeger/Greenwood
Godwin RK. 1979. The consequences of large monetary incentives in mail surveys of elites. Public Opin. Q. 43:378–87
Goemans HE, Gleditsch KS, Chiozza G. 2009. Introducing Archigos: a dataset of political leaders. J. Peace Res. 46:269–83
Goldstein K. 2002. Getting in the door: sampling and completing elite interviews. PS Political Sci. Politics 35:669–72
Grose CR. 2014. Field experimental work on political institutions. Annu. Rev. Political Sci. 17:355–370
Grose CR. 2021. Experiments, political elites and political institutions. In Advances in Experimental Political Science, ed. J Druckman, DP Green, pp. 149–64. New York: Cambridge Univ. Press
Grossman G, Michelitch K. 2018. Information dissemination, competitive pressure, and politician performance between elections: a field experiment in Uganda. Am. Political Sci. Rev. 112:280–301
Gulzar S. 2021. Who enters politics and why? Annu. Rev. Political Sci. 24:253–75
Hafner-Burton EM, Hughes DA, Victor DG. 2013. The cognitive revolution and the political psychology of elite decision making. Perspect. Politics 11:368–86
Hafner-Burton EM, LeVeck BL, Victor DG, Fowler JH. 2014. Decision maker preferences for international legal cooperation. Int. Organ. 68:845–76
Hafner-Burton EM, Victor DG, LeVeck BL. 2016. How activists perceive the utility of international law. J. Politics 78:167–80
Hemker J, Rink A. 2017. Multiple dimensions of bureaucratic discrimination: evidence from German welfare offices. Am. J. Political Sci. 61:786–803
Hertel-Fernandez A, Mildenberger M, Stokes LC. 2019. Legislative staff and representation in Congress. Am. Political Sci. Rev. 113:1–18
Heß M, Von Scheve C, Schupp J, Wagner A, Wagner GG. 2018. Are political representatives more risk-loving than the electorate? Evidence from German federal and state parliaments. Palgrave Commun.4:1–7
Hoffmann-Lange U. 2007. Methods of elite research. In The Oxford Handbook of Political Behavior,ed.RL Dalton, HD Klingemann, pp. 910–27. Oxford, UK: Oxford Univ. Press
Hoffmann-Lange U. 2008. Studying elite versus mass opinion. In The Sage Handbook of Public Opinion Research, ed. W Donsbach, MW Traugott, pp. 53–63. Los Angeles: Sage
Humayun F. 2021. The punisher’s dilemma: domestic opposition and foreign policy losses. Work. Pap., Yale Univ., New Haven, CT
Jamison J, Karlan D, Schechter L. 2008. To deceive or not to deceive: the effect of deception on behavior in future laboratory experiments. J. Econ. Behav. Organ. 68:477–88
Jost T, Meshkin K, Schub R. 2022. The character and origins of military attitudes on the use of force. Int. Stud. Q. In press
Karpowitz CF, Monson JQ, Preese JR. 2017. How to elect more women: gender and candidate success in a field experiment. Am. J. Political Sci. 61:927–43
Keller FB. 2016. Moving beyond factions: using social network analysis to uncover patronage networks among Chinese elites. J. East Asian Stud. 16:17–41
Kennedy C, Hartig H. 2019. Response rates in telephone surveys have resumed their decline. Pew Res. Cent. https://www.pewresearch.org/fact-tank/2019/02/27/response-rates-in-telephone-surveys-haveresumed-their-decline/
Kertzer JD. 2022. Reassessing elite-public gaps in political behavior. Am. J. Political Sci.Inpress
Kertzer JD, Busby J, Monten J, Tama J, Kafura C. 2021a. Elite misperceptions and the domestic politics of conflict. Work. Pap., Harvard Univ., Cambridge, MA
Kertzer JD, Holmes M, LeVeck BL, Wayne CN. 2022. Hawkish biases and group decision-making. Int. Organ. In press
Kertzer JD, Renshon J, Yarhi-Milo K. 2021b. How do observers assess resolve? Br. J. Political Sci. 51:308–30
Kertzer JD, Tingley D. 2018. Political psychology in international relations: beyond the paradigms. Annu. Rev. Political Sci. 21:319–39
Krcmaric D, Nelson SC, Roberts A. 2020. Studying leaders and elites: the personal biography approach. Annu. Rev. Political Sci. 23:133–51
Lasswell HD. 1952. The elite concept. In The Comparative Study of Elites: An Introduction and Bibliography,ed. HD Lasswell, D Lerner, CE Rothwell, pp. 6–21. Stanford, CA: Stanford Univ. Press
Leeper TJ, Hobolt SB, Tilley J. 2020. Measuring subgroup preferences in conjoint experiments. Political Anal. 28:207–21
Lin-Greenberg E. 2021. Soldiers, pollsters, and international crises: public opinion and the military’s advice on the use of force. Foreign Policy Anal. 17:orab009
Lin-Greenberg E, Pauly R, Schneider J. 2022. Wargaming for political science research. Eur. J. Int. Relat. 28:83–109
Linde J, Vis B. 2017. Do politicians take risks like the rest of us? An experimental test of prospect theory under MPs. Political Psychol. 38:101–17
List JA, Mason CF. 2011. Are CEOs expected utility maximizers? J. Econom. 162:114–23
Loewen PJ, Rubenson D, Wantchekon L. 2010. Help me help you: conducting field experiments with political elites. Ann. Am. Acad. Political Soc. Sci. 628:165–75
Lupia A, McCubbins MD. 1998. The Democratic Dilemma: Can Citizens Learn What They Need to Know? New York: Cambridge Univ. Press
Maestas C, Neeley GW, Richardson LE Jr. 2003. The state of surveying legislators: dilemmas and suggestions. State Politics Policy Q. 3:90–108
Mahdavi P. 2017. Scraping public co-occurrences for statistical network analysis of political elites. Political Sci. Res. Methods 7:385–92
Malesky E, Schuler P, Tran A. 2012. The adverse effects of sunshine: a field experiment on legislative transparency in an authoritarian assembly. Am. Political Sci. Rev. 106:762–86
Malhotra N, Monin B, Tomz M. 2019. Does private regulation preempt public regulation? Am. Political Sci. Rev. 113:19–37
McDermott R. 2011. Internal and external validity. The Cambridge Handbook of Experimental Political Science, ed. JN Druckman, DP Green, JH Kuklinski, A Lupia, pp. 27–40. New York: Cambridge Univ. Press
McDermott R. 2013. The ten commandments of experiments. PS Political Sci. Politics 46:605–10
Meisel JH. 1962. The Myth of the Ruling Class: Gaetano Mosca and the“Elite.”Ann Arbor: Univ.
Mich. Miller WE, Stokes DE. 1963. Constituency influence in congress. Am. Political Sci. Rev. 57:45–56
Mintz A, Redd SB, Vedlitz A. 2006. Can we generalize from student experiments to the real world in political science, military affairs, and international relations? J. Confl. Resolut. 50:757–76
Miratrix LW, Sekhon JS, Theodoridis AG, Campos LF. 2018. Worth weighting? How to think about and use weights in survey experiments. Political Anal. 26:275–91
Moyser G, Wagstaffe M. 1987. Studying elites: theoretical and methodological issues. In Research Methods for Elite Studies, ed. G Moyser, M Wagstaffe, pp. 1–24. Boston: Allen & Unwin
Mummolo J, Peterson E. 2019. Demand effects in survey experiments: an empirical assessment. Am. Political Sci. Rev. 113:517–29
Nair D. 2021.“Hanging out”while studying“up”: doing ethnographic fieldwork in international relations. Int. Stud. Rev. 23:1399–27
Nathan NL, White A. 2021. Experiments on and with street-level bureaucrats. In Handbook of Advances in Experimental Political Science, ed. J Druckman, DP Green, pp. 509–25. Cambridge, UK: Cambridge Univ. Press
Neumann IB. 2012. At Home with the Diplomats: Inside a European Foreign Ministry. Ithaca, NY: Cornell Univ. Press
Nyhan B, Reifler J. 2015. The effect of fact-checking on elites: a field experiment on US state legislators. Am. J. Political Sci. 59:628–40
Ofosu G. 2019. Do fairer elections increase the responsiveness of politicians? Am. Political Sci. Rev. 113:963–79
Oldendick RW, Bardes BA. 1982. Mass and elite foreign policy opinions. Public Opin. Q. 46:368–82
Ortmann A, Hertwig R. 2002. The costs of deception: evidence from psychology. Exp. Econ. 5:111–31
Page BI, Bartels LM, Seawright J. 2013. Democracy and the policy preferences of wealthy Americans. Perspect. Politics 11:51–73
Palacios-Huerta I, Volij O. 2009. Field centipedes. Am. Econ. Rev. 99:1619–35
Pereira MM. 2021. Understanding and reducing biases in elite beliefs about the electorate. Am. Political Sci. Rev. 115:1308–24
Poole KT, Rosenthal H. 1997. Congress: A Political-Economic History of Roll Call Voting. NewYork: Oxford Univ. Press
Potters J, van Winden F. 2000. Professionals and students in a lobbying experiment: professional rules of conduct and subject surrogacy. J. Econ. Behav. Organ. 43:499–522
Putnam R. 1976. The Comparative Study of Political Elites. Englewood Cliffs, NJ: Prentice-Hall Ramey AJ, Klingler JD, Hollibaugh GE. 2016. Measuring elite personality using speech. Political Sci. Res. Methods 7:1–22
Renshon J. 2015. Losing face and sinking costs: experimental evidence on the judgment of political and military leaders. Int. Organ. 69:659–95
Renshon J, Yarhi-Milo K, Kertzer JD. 2022. Democratic reputations in crises and war. J. Politics. In press Ricart-Huguet J. 2019. The historical turn in the comparative study of political elites. Newsl. Organ. Sect. Comp. Politics Am. Political Sci. Assoc. 29:86–93
Rivera SW, Kozyreva PM, Sarovskii EG. 2002. Interviewing political elites: lessons from Russia. PS Political Sci. Politics 35:683–88
Rodríguez-Teruel J, Daloz JP. 2018. Surveying and observing political elites. In The Palgrave Handbook of Political Elites, ed. H Best, J Higley, pp. 93–113. London: Palgrave Macmillan
Roth AE. 1986. Laboratory experimentation in economics. Econ. Philos. 2:245–73
Saunders EN. 2011. Leaders at War: How Presidents Shape Military Interventions. Ithaca, NY: Cornell Univ. Press
Saunders EN. 2017. No substitute for experience: presidents, advisers, and information in group decision making. Int. Organ. 71:S219–47
Saunders EN. 2022. Elites in the making and breaking of foreign policy. Annu. Rev. Political Sci. 25:219–40
Sedlmeier P, Gigerenzer G. 1989. Do studies of statistical power have an effect on the power of studies? Psychol. Bull. 105:309–16
Shaffer R, Pinson LE, Chu JA, Simmons BA. 2020. Local elected officials’receptivity to refugee resettlement in the United States. PNAS 117:31722–28
Sharpe D, Adair JG, Roese NJ. 1992. Twenty years of deception research: a decline in subjects’trust? Pers. Soc. Psychol. Bull. 18:585–90
Sheffer L, Loewen P. 2019. Electoral confidence, overconfidence, and risky behavior: evidence from a study with elected politicians. Political Behav. 41:31–51
Sheffer L, Loewen PJ, Soroka S, Walgrave S, Sheafer T. 2018. Nonrepresentative representatives: an experimental study of the decision making of elected politicians. Am. Political Sci. Rev. 112:302–21
Sherman GD, Lerner JS, Josephs RA, Renshon J, Gross JJ. 2016. The interaction of testosterone and cortisol is associated with attained status in male executives. J.Pers.Soc.Psychol.110:921–29
Stolwijk S, Vis B. 2020. Politicians, the representativeness heuristic and decision-making biases. Political Behav. 43:1411–32
Teele DL, Kalla J, Rosenbluth F. 2018. The ties that double bind: social roles and women’s underrepresentation in politics. Am. Political Sci. Rev. 112:525–41
Teigen M, Karlsen R. 2019. Influencing elite opinion on gender equality through framing: a survey experiment of elite support for corporate board gender quotas. Politics Gender 16:792–815
Tetlock PE, Lebow RN. 2001. Poking counterfactual holes in covering laws: cognitive styles and historical reasoning. Am. Political Sci. Rev. 95:829–43
Tingley DH. 2011. The dark side of the future: an experimental test of commitment problems in bargaining. Int. Stud. Q. 55:521–44
Tomz M, Weeks J, Yarhi-Milo K. 2020. Public opinion and decisions about military force in democracies. Int. Organ. 74:119–43
van der Meij L, Schaveling J, van Vugt M. 2016. Basal testosterone, leadership and dominance: a field study and meta-analysis. Psychoneuroendocrinology 72:72–79
Vis B, Stolwijk S. 2020. Conducting quantitative studies with the participation of political elites: best practices for designing the study and soliciting the participation of political elites. Qual. Quantity 55:1281–317
Walgrave S, Sevenans J, Van Camp K, Loewen PJ. 2018. What draws politicians’attention? An experimental study of issue framing and its effect on individual political elites. Political Behav. 40:547–69
Yarhi-Milo K. 2018. Who Fights for Reputation in International Politics? Leaders, Resolve, and the Use of Force. Princeton, NJ: Princeton Univ. Press
Yarhi-Milo K, Kertzer JD, Renshon J. 2018. Tying hands, sinking costs, and leader attributes. J. Confl. Resolut. 62:2150–79
Zaller JR. 1992. The Nature and Origins of Mass Public Opinion. Cambridge, UK: Cambridge Univ. Press Zuckerman H. 1972. Interviewing an ultra-elite. Public Opin. Q. 36:159–75
〇 编辑、排版:焦磊
〇 审校:郭瑞涵 大兰